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BESCHREIBUNG 

Spracheingabeschnittstelle fur Dialogsysteme 

Die Erfindung betrifft ein Verfahren zum Betrieb eines Dialogsystems mit einer Sprach- 
5 eingabeschnittstelle. Sie betrifft auBerdem ein Verfahren und ein System zur Erstellung einer 
Spracheingabeschnittstelle, eine entsprechende Spracheingabe-Schnittstelle und ein 
Dialogsystem mit einer derartigen Spracheingabeschnittstelle. 

Sprachgesteuerte Dialogsysteme haben ein breites gewerbliches Anwendungsspektrum* Sie 
10 werden in Sprachportalen aller Art eingesetzt, beispielsweise beim Telefon-Banking, der 

sprachgesteuerten automatischen Watenausgabe, zur Sprachsteuerung von Freisprechanlagen 
inFahrzeugen oder in sogenannten Home-Dialog- Systemen. Daruber hinaus ist es moglich, 
diese Technologie in automatische Ubersetzungs- und Diktatsysteme einzusetzen. 

15 Bei der Entwicklung und Herstellung von Sprachdialogsystemen besteht das allgemeine 

Problem, die Spracheingabe des Benutzers eines Dialogsystems zuverlassig zu erkennen, auf 
effiziente Art und Weise zu verarbeiten und in die vom Benutzer gewiinschte systeminteme 
Reaktion umzusetzen. Je nach GroBe des Systems und Komplexitat des zu beherrschenden 
Dialogs etgeben sich hierbei vieUSltige einander bedingende Teilprobleme: Die 

20 Spracherkennung gliedert sich in der Regel in einen syntaktischen Teilschritt, der eine gultige 
AuBerung detektiert, und einen semantischen Teilschritt, der die als giiltig erkannte AuBerung 
auf ihre vom System verwendbare Bedeutung abbildet Diese Spracherkennung erfolgt daher 
meist durch eine spezialisierte Sprachverarbeitungsschnittstelle des Dialogsystems, die die 
AuBerung des Benutzers beispielsweise durch ein Miknophon aufoimmt, sie in ein digitales 

25 Sprachsignal umsetzt und anschlieBend die Spracherkennung durchfuhrL 
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Die Verarbeitung des digitalen Sprachsignals durch die Sprachedcennung wird zu einem 
groBen Teil von Softwarekomponenten durchgefuhrL In der Regel liegt daher als Ergebnis der 
Spracherkennung die Bedeutung einer AuBerung in Form von Daten und/oder 
5 Prograrnmanweisungen vor. Diese Programmanweisungen werden schlieBlich ausgefuhrt bzw. 
die Daten verwendet und fuhren soinit zu der von Benutzter beabsichtigten Reaktion des 
Dialogsystems. Diese Reaktion kann beispielsweise aus einer elektronischen oder 
mechanischen Handlung (zJB. Auswerfen von Geldscheinen bei einem sprachgesteuerten 
Geldautomaten) oder aus einer rein programmbezogenen und somit fur den Benutzer zunachst 

10 transparcnten Datenmanipulation bestehen (z.B. Anderung des Kontostandes). Ublicherweise 
wird daher die tatsachliche Umsetzung der Bedeutung einer SprachauBerung, also das 
Ausfuhren der "semantischen" Prograrnmanweisungen durch eine von der 
Spracheingabeschnittstelle logisch getrennte Applikation, beispielsweise ein Steuerprogramm, 
durchgefuhrL Die Steuerung des Dialogsystems selbst erfolgt in der Regel durch einen 

15 sogenannten Dialogmanager auf Basis einer vorgegebenen deteiiiiijDistischen 
Dialogbeschieibung. 

Abhangig von dem Stadium des Dialogs zwischen Benutzer und Dialogsystem befindet sich 
das Dialogsystem zu einer bestimmten Zeit in einem definierten Zustand (spezffiziert durch die 

20 Dialogbeschreibung) und geht bei einer gultigen Anwedsung des Benutzers in einen 
entspiechend andeien Zustand uber. Fiir jeden dieser Zustandsubergange muss die 
Spracheingabeschnittstelle eine individuelle Spracheikennung vomehmen, da bei jedem 
. . Zustandsubergang andere Aufieningen.erkannt.und.eindeutig auf die.korrekte Semantik 
abgebildet werden miissen. So wird beispielsweise in einem Zustand lediglich eine Bestatigung 

25 durch ein 11 Ja" erwartet, wahrend in einem andeien Fall einer komplexen AuBerung dezidierte 
Informationen (zJB. eine Kontonummer) entnommen werden miissen. In der Praxis miissen bei 
jedem Zustandsubergang mehrere synonyme AuBerungen auf den gledchen semantischen Sinn 
abgebildet werden, so verfolgen zJB. die Anweisungen "Halt", "Stop", f, Ende" und "Schluss" 
alle das gldche Ziel, namlich einen Pnozess zu beenden. 
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Zur Behandlung der Komplexitat des Problems des Verstehens und der Weiterverarbeitung 
einer SprachauBerung gibt es unterschiedliche Ansatze. So ist es priBzipiell moglich, fur jede 
giiltige AuBerung einesjeden Zustandsiibergangs ein prototypisches Sprachsignal 
5 abzuspeichern, mit denen eine konkrete AuBerung silben- oder wortweise mit stochastischen 
oder spektralen Mefhoden verglichen werden muss. Eine adaquate Reaklion auf eine 
SprachauBerung kann programmiertechnisch als direkte Folge auf das Erkennen einer 
bestimmten AuBerung realisiert werden. Bei komplexen Dialogen, bei denen es unter 
Umstanden notig ist, detaillierte Informationen zu ubergeben, fuhrt dieser starre Ansatz zu der 
10 Notwendigkeit, einerseits alle erlaubten synonymen Varianten einer AuBerung vorliegpn zu 

haben, urn diese bei Bedarf mit der AuBerung eines Benutzers zu vergleichen, und andererseits 
benutzerspezifische Information durch spezielle Programmroutinen weiterzuverarbeiten. Es 
liegt auf der Hand, dass diese Losung inflexibel und durch einen Betreiber eines Dialogsystems 
nur sehr schwer erweiterbar und adaptierbar ist 

15 

Einen andere Strategie verfolgt der dynamischere grammatikalisjche Ansatz, der zur 
Spracherkennung linguistisch- grammatikalische Modelle in Form von formalen Grammatiken 
einsetzt Formale Grammatiken sind algebraische Strukturen, die aus Ersetzungsregeln, 
Temiinalwortem, Nichtteminalwortem und einemStartwort bestehen. Die Ersetzungsregeln 
20 geben Vorschriften, nach denen Mchttemiinalworter strukturell in Wortketten bestehend aus 
Nichtteonnial- und Tetminalwortem uberfuhrt (abgeldtet) werden konnen. Alle Satze, die nur 
aus Terminalwortem bestehen und durch Anwendung der Ersetzungsregeln ausgehend von 
dem Startwort erzeugt werden konnen, reprasentieren giiltige Satze der durch die formalen 
Grammatik spezifizieiten Sprache. 

25 

Beim gramnmtikalischen Ansatz werden fiirjeden Zustandsiibergang eines Dialogsystems 
durch die Ersetzungsregeln einer formalen Grammatik die erlaubten Satzstrukturen generisch 
voigegeben und durch die Terminalworter das Vokabular der Sprache spezifiziert, deren 
samtliche Satze als giiltige AuBmmg eines Benutzers akzeptiert werden. Eine konkrete 
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SprachauBerung wird also durch die Uberpriifung verifiziert, ob sie durch Anwenden der 
Ersetzungsregeln und Einsetzen des Vokabulars aus dem Startwort der entsprechenden 
formalen Grammatik ableitbar ist Moglich sind audi Ausfiihrungen, bei denen nur die 
sinntragenden Worter an den durch die Ersetzungsregel gegebenen Stellen der Satzstruktur 
5 uberpriift werden. 

Neben dieser syntaktischen Verifikation eines Satzes muss die Spracheikennung jedern 
giiltigen Satz seine Semantik, dh. eine Bedeutung zuordnen, die in eine Reaktion des Systems 
umsetzbar ist Die Semantik besteht aus Programmanweisungen und/oder Daten, die durch die 

10 Applikation des Dialogsystems anwendbar sind. Zur Zuordnung von ausfuhrbaren 

Programmanweisungen zu den entsprechenden syntaktischen Elementen werden haufig solche 
Grammatiken verwendet, die die Semantik in Form eines sogenannten Attributs mit dem 
zugehorigen Terminal- /Mchtterminalwort verkniipfen. Bei sogenannten synthetisierten 
Attributen wird dabei fur Nichttemiinalworter der Attributwert aus den Attributen letztlich der 

15 Terminalworter bercchnet Bei sogenannten venerbten Attributen konnen zur Attributbe- 
rechnung auch Mbrmationen aus dem iibergeordneten Nichtterminal benutzt werden. Die 
Semantik einer SprachauBerung wird dadurch bei der Ableitung des Satzes aus dem Startwort 
als Attribut oder Attributfolge implizit miterzeugt Dadurch wird zumindest formal die direkte 
Abbildung der Syntax auf die Semantik ermoglicht 

20 

Die US 6,434,529 Bl offenbart ein System, das sich einer objektorientierten Programm- 
technologie bedient und giiltige SprachauBerungen mittels formaler Grammatiken identifiziert 
. Die formale Grammatik und ihxe Uberpriifung ist in .diesem System mittels einer Jhtsipreter- 
sprache implementierl Da zur semantischen Umsetzung der als syntaktisch korrekt erkannten 
25 Satzelemente objektorientierte Klassen in einem iibersetzten (kompili^ten) Applikations- 
programm instanziiert bzw. flue Methoden ausgefuhrt werden, ist eine Schnittstelle zwischen 
der von einem Interpreter durchzufuhxenden Syntaxanalyse und der semantischen Umsetzung 
in dem laufiahigen maschinensprachlidien Applikationsprogramm vorgesehen. 
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Diese Schnittstelle ist wie folgt reaMett In der Spezifikation der Grammatik bzw. ihren 
Ersetzungsregeln sind den Terminal- und/oder den Nichtteiminalwortem semantische Attribute 
in Form von skriptsprachlichen Programmfragmenten zugeordnet Diese semantischen Skript- 
fragmente werden wahrend der syntaktischen Ableitung (dem sogenannten Parsing) der 
5 SprachauBerung gemaS der Anwendungsredhenf olge der Ersetzungsregeln in eine hierarchische 
Datenstruktur umgesetzt, die den gesprochenen Satz syntaxstrukturell reprasentiert Anschlie- 
Bend wird die hierarchische Datenstruktur dutch einen weiteren Parsing- Schritt in eine Tabelle 
umgesetzt und stellt schlieBlich eine vollstandige, linear ausfiihrbare, programmiersprachhche 
Reprasentation der Semantdk der entsprechenden AuBerung dar, die aus skriptsprachlichen 
10 Anweisungen zur Instanziierung eines Objektes oder zur Ausfuhrung einer Methode im Appli- 
kationspiogramm besteht Diese Reprasentation kann nun durch einen Parser/Interpreter 
ausgew^tet werden, indern die entsprechenden Objekte direkt im Applikationsprogramm 
angelegt werden und die entsprechenden Methoden von diesem ausgefuhrt werden. 

15 Die Nachteile dieser Technologie sind teilweise bereits anhand ihrer Beschreibung ersichflich. 
Die Verwendung einer (u.U. proprietaren) Ihterpretersprache zur Syntaxanalyse und einer 
Ubersetzersprache fur das Applikationsprogramm erfordert eine komplexe und komplizierte 
Schnittstelle zwischen der Spracheingabeschnittstelle und der Applikation, die zwei vollig 
unterschiedlichen Programmi ertechnologien reprasentieren. 

20 

AuBerdem ist eine Erweiterung oder Anderung sowohl der grammatikalischen Sprachspezifi- 
kation als auch der Semantik- Skripte fur einen Benutzer nicht ohne weiteres moglich, da er 
dazu zunachst die spezielle Skriptsprache erlemen muss. Daruber hinaus muss unter Um- 
standen eine Erweiterung oder Anderung der Semantik durch Anpassen der entsprechenden 
25 semantischer Programmfragmente auch in der Applikation implementiert und ubersetzt (kom- 
piliert) werden. Deshalb ist bei dieser Technologie die Sprache nicht wahrend der Laufeeit des 
Dialogsystems veranderbar oder adaptierbar. Da bei der Umsetzung der Syntax in Semantik 
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(also zur Laufceit des Dialogsystems) Parser bzw. Interpreter eingesetzt werden, entsteht 
zudem bei der Pflege der verschiedenen Komponenten des Systems ein erhohter War- 
tungsaufwand, 

5 

Es ist eine Aufgabe der vorliegenden Etfindung, den Betrieb und Aufbau einer Sprachein- 
gabeschnittstelle eines Dialogsystems so zu ermoglichen, dass die zu erkennende Sprache 
durch eine einfache, schnelle und insbesondere leicht veranderbare SpezifiOkation einer for- 
malen Grammatik definiert werden kann und SprachauBerungen eflHzient auf ihre Semantik 
10 abgebildet werden. 

Diese Aufgabe wird zum einen durch ein Verfahien zum Betrieb eines Dialogsystems mit einer 
Spracheingabeschnittstelle und einer mit der Spracheingabeschnittstelle zusammenwirkenden 
Applikation gelost, bei dem die Spracheingabeschnittstelle Audiosprachsignale eines Benu- 

15 tzers erfasst und direkt in ein Erkennungsergebnis in Form von Binardaten umsetzt und dieses 
Ergebnis der Applikation zur Ausfuhrung bercitstellt Unter Binardaten sollen im folgenden 
Daten und/oder Programmanweisungen (oder Referenzen bzw. Zeiger darauf) verstanden 
werden, die ohne wedtere Transformation oder Interpretation unmittelbar von der Applikation 
verwendbar/ausfiihrbar sind, wobei die unmittelbar ausfiihrbaren Daten von einem maschineo- 

20 sprachlichen Teilprogramm der Spracheingabeschnittstelle erzeugt werden. Hierunter ist 
insbesondere auch der Fall zu verstehen, dass als Erkennungsergebnis ein oder mehiere 
maschinensprachliche Programmmodule erzeugt werden, die der Applikation zur unmitielr 
baren Ausfuhrung bereitgesteUt werden. Zum anderen wird die Aufgabe duich ein Verfahien 
zur Brstellung einer Spracheingabeschnittstelle fiir ein Dialogsystem mit einer mit der Sprach- 

25 eingabeschnittstelle zusammenwirkenden Applikation gelost, welche die folgenden Schritte 
umfesst Spezifizieien giiltiger Spracheingabesignale durch eine formale Grammatik, wobei das 
gultige Vokabular der Spracheingabesignale als Terminalworter dear Grammatik definiert wird; 
Bereitstellen von Binardaten, die die Semantik giiltiger Audiosprachsignale reprasentieren und 
die aus zur Systemlaufeeit durch die Applikation unmittelbar verwendbaren und von einem 
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Programmtedl der Spracheingabeschnittstelle erzeugten Datenstrukturen bestehen oder aus 
unmittelbar von der Applikation ausfuhrbaren Programmmodulen bestehen, und/oder 
Bereitstellen von Programmteilen, welche die Binardaten erzeugen; Zuordnen der Binardaten 
und/oder Programmteile zu einzelnen oder Kombinationen von Terminalwortern oder 
5 Nichtterminalwortern, zur Abbildung eines giilligen Audiosprachsignals auf eine passende 
Semantik; Ubersetzen der Programmteile und/oder der Programmmodule in Maschinen- 
sprache, derart, dass die ubersetzten Programmteile beim Betrieb des Dialogsystems 
unmittelbar von der Applikation nutzbare Datenstrukturen erzeugen bzw. die ubersetzten 
Programmmodule beim Betrieb des Dialogsystems unmittelbar von der Applikation ausfuhrbar 
10 sind, wobei die Datenstruktarer^ die Semantik einer SprachauBerung 

darstellen. 

ErfindungsgemaB wind folglich die in ein Audiosignal umgewandelte SprachauBerung des 
Benutzers von der Spracheingabeschnittstelle des Dialogsystems direkt in Binardaten 

15 transfoimiert, die die semantische Umsetzung der Spracheingabe und insofem das Erken- 
nungsergebnis reprasentieren. Dieses Erkennungsergebnis kann unmittelbar von dem mit der 
Spracheingabeschnittstelle zusammenwiikenden Applikationsprogramm verwendet werden. 
Dass diese Binardaten insbesondere auch aus einem oder mehrere maschinensprachlichen 
Programmmodule bestehen konnen, die unmittelbar von der Applikation ausfuhrbar sind, wixd 

20 beispielsweise dadurch eneicht, dass die Spracheingabeschnittstelle in einer Ubersetzer- 
sprache geschrieben ist und die Programmmodule des Erkennungsergebnisses, ebenfalls in 
einer -moglicherweise unterschiedlichen- Ubersetzersprache implementiert wurdert Voizugs- 
weise sind diese Programmmodule in der gleichen Sprache geschrieben, in der auch die 
Spracherkennungslogik implementiert wurde. Sie konnen aber auch in einer Sprache geschrie- 

25 ben und kompiliert sein, die auf der gleichen Plattform wie die Spracheingabeschnittstelle 
arbeitet Dadurch ist es je nach verwendeter Ubersetzersprache moglich, entweder die 
ausfuhrbaren Programmmodule als solche oder Referenzen tew. Zeiger auf diese Module 
dem Applikationsprogramm als Bkennungsergebnis zur unmittelbaien Ausfuhrung bereit- 
zustellen. 
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Besonders vorteilhaft ist dabei der Einsatz einer objektorientierten Programmiersprache, da 
hiermit einerseits die Programmmodule der Applikation in Form von Objekten bzw. Metho- 
den von Objekten zur unmittelbaren Ausfuhrung bereitgestellt werden konnen, und anderer- 
5 seits auch die von der Applikation unmittelbar zu verwendenden Datenstruktuien als Objekte 
einer objektorientierten Programmiersprache reprasentiert werden konnen. 

Diese Erfindung bietet vielfaltige Vorteile. Durch die Realisierung der Spracherkennung der 
Sprachemgabeschnittstelle, insbesondere der Semantiksynthese, als ein von Prozessor 

10 unmittelbar ausfuhrbaies Maschinenprogramm (im Gegensatz zu einem nur mittelbar von 

einem Interpreter ausfuhrbares Skriptprogramm) wird die direkte Generierung eines von dem 
maschinensprachlichen Applikationsprogramm unmittelbar verwendbaren Etkennungsergeb- 
nisses ermoglicht Dadurch ergibt sich die groBtmoghche Effizienz bei der Umsetzung der 
SprachauSerung in eine adaquate Reaktion des Dialogsystems. Insbesondere wird dadurch 

15 eine komplizierte und datentechnisch aufwmdige Abbildung der von einem skriptspracMichen 
Parser aus einer formalen Grammatik gewonnenen semantischen Attribute bzw. Skriptpro- 
grammfragmente in eine.maschinensprachliche Reprasentation uberfliissig. Weitere Vorteile 
ergeben sich aus der Moglichkeit, beim Aufbau oder der SpezafScation einer Spracheingabe- 
schnittstelle durch einen Dienstleister oder bei ihier Anpassung an neue Fakten (z.B. Sonder- 

20 angebote bei einem Veikaufsautomat) herkommliche Programrniersprachen wie C, C++, C# 
oder Java anstelle von proprietaren Skriptsprachen des Herstellers der Spracheingabeschnitt- 
stelle verwenden zu konnea Derartige Sprachen sind einem breiten Anwenderspekirum 
zumindest insoweit bekannt, dass einfache Anpassungen. oder.Erweiterung der Syntax der 
vom System zu verstehenden SprachauBerungen oder der zugehorigen semantischen Pro- 

25 grammmodule iiber eine entsprech^ide Eingabeschnittstelle oft ohne weiteaces durchgefuhrt 
werden konnen. Es entfallt also die Notwendigkeit, zur Neukonfiguration oder zum Update 
des Dialogsystems eine proprietare Sprache erlemen zu miissen. Fiir den Hersteller ergibt sich 
aus der Verwendung einer Ubersetzersprache weiterhin der Vorteil einer einfacheren und 
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somit kostengiinstigeren softwaretechnischen Wartung des Systems, da haadelsubliche 
Standard-Compiler eingesetzt werden konnen und das Warten bzw. Weiterentwickeln einer 
eigenen Skriptsprache sowie der entspiechenden Parser und Interpreter entfallt 

5 Das Umsetzen der SprachauBerung in semantische Programmxnodule kann im einfachsten 
Falle durch eine direkte und eindeutige Zuoidnung der moglichen SprachauBerungen zu den 
entspiechenden Programmmodulen geschehen. Eine flexiblere, erweiterbare und efRziente 
Spracherkennung erhalt man jedoch durch die methodische Trennung der Spracherkennung in 
einen Syntaxanaly se- Schritt und einen Semantiksynfhese-Schritt Durch die Definition der von 

10 der Spracheingabeschnittstelle zu verstehenden Sprache mittels einer formalen Grammatik 
wird die Syntaxanalyse, also die Uberprufung einer SprachauBerung, auf ihre Gultigkeit for- 
malisiert und von der semantischen Umsetzung getrennt Das giiltige Vokabular der Sprache 
eigibt sich aus den Terminalwortern der Grammatik, wahrend die Satzstruktur durch die 
Ersetzungsregeln und die Mchttemiinalworter bestimmt wird. Da sowohl die Syntaxanalyse als - ; 

15 audi die Semantiksynthese von einem oder mehreren Maschinenprogrammen durchgefuhrt 
werden, wird das Erkennungsergebnis einer SprachauBerung diiekt in Form von Binardaten, 
insbesondere Programmmodulen, erzeugt, die unmittelbar von der Applikation verwendbar/ 
ausfuhrbar sind.. Beispiele dafiir sind ein vom Prozessor linear abarbeitbares Programmmodul, 
das sich bei der Zuordnung eines semantischen, maschinensprachlichen Programm&agments 

20 zujedem Terminal- und Nichtterminalwort durch eine attributierte Grammatik, aus der Traver- 
sierung des Ableitungsbaums einer giiltigen SprachauBerung ergibt Ein anderes Bespiel ware 
eine binare Datenstruktur, die einen Zeitpunkt beschreibt und als Attribut einer Zeitgiammatik 
aus deren Bestandteilen synthetisiert worden isL 

25 In vielen Fallen wird die Grammatik vor der Iribetriebnahme des Dialogsy stems vollstandig 
definiert und bleibt wahrend des Betriebs unverandert Voizugsweise ist jedoch eine dyna- 
mische Anderung dear Grammatik wahrend des Betriebs des Dialogsystems moglich, indem die 
Syntax und Semantik der vom Dialogsystem zu verstehenden Sprache der Applikation 
beispidsweise in Form einer dynamisch bindbaraa Bibliothek (dynamic linked library) zur 
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Veifugung gestellt werden. Dies ist bei haufiger Anderung von Sprachelementen oder seman- 
tischen Anderungen, beispielsweise bei Sonderangeboten oder wechselnden Infomiationsan- 
geboten von groBem VorteiL 

5 Besonders bevorzugt wird die Spracherkennung in einer objektorientierten Ubersetzersprache 
implementiert Das eroffhet eine effiziente und vom jeweiligen Anwender leicht zu modifizie- 
rende Realisierung von generischen Standard-Ersetzungsregeln von forrnalen Sptachen - wie 
z.B. einer Terminalregel, einer Kettemegel und einer Altemativregel - als objektorientierte 
Gnammatik- Klassen. Die gemeinsamen Eigensehaften und Funktionalitaten, insbesondeie eine 

10 generische Parsing-Methode, dieser Graminatik- Klassen konnen beispielsweise von einer 
oder gar mehreren unspezifischeten Basisklassen geerbt werden. Ebenso konnen die Basis - 
klassen virtuelle Methoden dutch Vererbung an die Grammatik-Klassen weitergeben, die bei 
Bedarf uberladen bzw. uberschrieben werden konnen, urn konkrete Funktionalitaten wie 
beispielsweise bestimmte Parsing-Methoden zu realisieren. Mit den entsprechenden in den 

15 jeweiligen Klassendefinitionen vorgesehenen Konstruktoren kann dann die Grammatik einer 
konkreten Sprache durch Instanziierung der generischen Grammatik-Klassen spezifiziert 
. werden. Hierbei warden durch die Definition der Terminal- und Nichtterminalworter konkrete 
Ersetzungsregeln als programmiersprachliche Objekte erzeugt. Jedes dieser Grammatik- Ob- 
jekte besitzt dann eine individuelle Evaluierungs- bzw- Parsingmethode, die uberpruft, ob die 

20 entsprechende Regel auf die detektierte Phrase anwendbar ist Die geeignete Anwendung der 
Ersetzungsregeln und damit die Giiltigkeitsuberpiiifung des gesamten Sprachsignals bzw. die 
Detektion der entsprechenden Phrase wird durch den Syntaxanaly se- Schritt der Spracher- 
. kennung gesteuert 

25 Durch die konsequente Umsetzung des systematisierenden Konzepts der vorliegenden Rfin- 
dung wird in einer bevorzugten Ausfuhrungsform die rnethodische Tiennung zwischen Syntax- 
analyse und Semantiksynthese beibehalten, wahrend die zeitliche Trennung ihrer Anwendung 
zum Zwecke der RflRzienzsteigerung und Reduktion der Antwortzeiten zumindest teilweise 
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aufgehoben wird. Bed der Verwendung attributierter Grammatiken werden wahrend der 
Ableitung eines zu erkennenden Sprachsignals aus dem Startwort die entsprechenden 
semantischen Binardaten (das Attribut) einer anwendbaren Ersetzungsregel direkt erzeugt 
Sobald also zum Beispiel in edner Regel <,,Viertel vor" <Zahl von 1 bis 12» die Zahl als 
5 Ergebnis der Regel <Zahl von 1 bis 12> bekannt ist, kann eine entsprechende Uhrzeitdaten- 
struktur, in diesem Fall mit Wert „1 1:45 Uhr", erzeugt werden. Falls andererseits bei der 
weiteren Anwendungen geeigneter Ersetzungsregeln die zur Ausfuhrung eines semantischen 
Programmmoduls erforderlichen Parameter bekannt werden, kann dieses Progra rnm modul 
direkt von der Spracheingabeschnittstelle ausgefuhrt werden. Die Semantik wird also nicht 

10 erst vollstandig aus dem Sprachsignal extrahiert, sondern sie wird quasi-parallel wahrend der 
syntaktischen Uberpriifung bereits umgesetzt und ausgefuhrt Statt Referenzen auf ausfuhrbare 
Programmfragmente und entsprechende Parameter, iibergibt die Spracheingabeschnittstelle 
dem Applikationsprogramm direkt die - andernf alls von der Application zu berechnenden — 
Ergebnisse. Diese besonders vorteilhafle Ausfuhrungsform wird dunch Realisierung der syn- 

15 taktischen Uberprufung zur Spracherkennung, der semantischen Programmmodule und des 
AppUkationsprogramms als maschinensprachliche Programme ermoglicht, weil die Programm- 
einheiten des Dialogsystems dadurch tiber geeignete Schnittstellen efRzient kommunizieren und 
Daten austauschen konnen. 

20 Bei einem objektorienlierten Aufbau der Spracheingabeschnittstelle unter Verwendung 
attributierter Grammatiken konnen die semantischen Programmmodule als programmier- 
sprachliche Objekte bzw. Mefhoden von Objekten realisiert werden. Diese zusatzliche 
Systematisierung der semantischen Sdte wird von der vorliegenden Erfindung unterstutzt, 
indem die Grammatik-Klassen so instanziiert werden konnen, dass sie anstelle der Standard- 

25 werte (also beispielsweise einzelnen oder Listen von erkannten Terminal- und Nichtterminal- 
worten) "semantische" Objekte zuruckgeben, die durch das Ub^chreiben von virtuellen 
Mefhoden der jeweiligen Grammatik-Klassen definiert werden. Ebenso konnen bei Anwen- 
dung entsprechender Ersetzungsregeln (also beim Parsen des Sprachsignals) semantische 
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Objekte zuriickgegeben werden, die aus den beim Parsen zuriickgegebenen Werten 
berechnet werden. 

Das oben genannte erfindungsgemaBe Verf ahren zur Erstellung einer Spracheingabeschnitt- 
5 stefle bielet die Moglichkeit einer einfachen, schnellen und fehlerannen Neuerstellung bzw. 
Konfiguration von Sprachverarbeitungsschnittstellea Dabei wild zur Spezifikation der zu 
erkennenden Sprache zunachst eine formale Grarnmatik generisch definiert, indem das gultige 
Vokabular der Sprache durch die Temiinalworter und die gultige Struktur der SprachauBe- 
rungen durch die Ersetzungsregeln bzw. die Nichtterminalworter bestirnmt wird. Nach der 

10 Spezifikation dieser syntaktischen Ebene wild die semantische Ebene durch die Bereitstellung 
von in einer Ubersetzersprache geschriebenen Programmmodulen spezifiziert, deren maschi- 
nensprachlichen Ubersetzungen zur Laufzeit des Dialogsystems zur Abbildung der syntak- 
tischen Struktur auf die entsprechende Semantik einer SprachauBerung geeignet kombiniert 
werden konnen; weiter konnen Binardaten spezifiziert werden, und/oder Programmteile, die 

15 die Binardaten und/oder die Programmmodule zur Laufeeit geeignet kombinieien. Zwischen 
der syntaktischen und der semantischen Ebene wild eine eindeutige Zuordnung definiert, so 
dassjedem. Terminal- und Nichtterminalwort ein seine Semantik beschreibendes Rrogramm- 
modul zugeordnet wird. Da die semantischen Programmmodule in einer Ubersetzersprache 
(zJB. C, C++ o.A.) implementiert werden, miissen sie nach ihrer Definition mit dem entspre- 

20 chenden Compiler iibersetzt werden, urn sie fur die unmittelbare Ausfuhrung beim Betrieb des 
Dialogsystems beteitzustellen. 

Dieses Verfahren besitzt mehreie Vorteile. Es ennoglicht.einerseits einem Dienstleister, der 
Spracheingabeschnittstellen fur bestimmte Anwendnngen entwirft oder konfiguriert, auf sehr 
25 einfache Weise Syntax und Semantik mittels einer bekannten Ubersetzersprache zu spezifi- 
zieien. Es muss also nicht eine mitunter komplexe proprietare (Skript-) Sprache des Her- 
stellers erlemt werden. Dariiber hinaus ist die Verwendung einer Ubersetzersprache aufgrund 
der Uberprufiing durch den Ubersetzer und der Manipulationssicherheit der Maschinenpro- 
gramme weniger fehleranfallig und beim Endkunden stabiler und schneller einsetzbar. 
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Die ubersetzten semantischen Programmmodule konnen nach der Spezifikation der Semantik 
dem Dialogsysteni eines Eadkunden beispielsweise als dynamische oder statische Bibliotheken 
zur Verfugung gestellt werden. Im Falle einer dynamisch zu bindenden Bibliothek muss das 
5 Applikationsprogramm des Dialogsystems nach der Bereitstellung geanderter semantischer 
Programmmodule nicht neu iibersetzt werden, da es die auszufiihienden Programmmodule 
iiber Refeienzierung ansprechen kann. Dies hat den Vorteil, dass eine Semantik wahrend des 
Betriebs eines Dialogsystems geandert werden kann, beispielsweise wenn ein Verkaufs- oder 
Bestefldialogsystem bed sich haufig andemden Angeboten regelmaBig moglichst unterbre- 
10 chungsfiei aktualisiert werden muss. 

Bed einer vorteilhaften Ausfuhrungsform dieses Verfahiens wird zur Spezifikalion der Gram- 
matik und der ihr zugeordneten Semantik eine objektorientierte Programmiersprache 
verwendet Die fonnale Grammatik der zu erkennenden SprachauBerungen kann dann als 

15 Instanzen von Giammatik-Klassen spezifiziert werden, die generische Standard-Ersetzungs- 
iegeln iealisieien und ihre gemeinsamen Eigenschaften und Funktionalitaten von einer oder 
mehneren grammatikalischen Basisklassen erben. Die Basisklassen stellen beispielsweise 
generische Parser- Methoden zur Verfugung, die bei der Spezifizierung der Grammatik an die 
konkret mit Terminal- und Nichttermin alwortern instanziierten Ersetzungsregeln auf der Ebene 

20 der Grammatik- Klassen angepasst werden mussen. Es ist sinnvoll, zur eflSzienten Spezifikation 
von Grammatiken Grarcuiiatik-KlassenMeiaichien und/oder Grammatik-Klassenbibhotheken 
vorzusehen, die eine Vielzahl von moglichen Grammatiken beredts definieren und auf die im 
BedarfsfaUe zuriickgegriffen werdra kann. 

25 Ebenso konnen die Basisklassen virtuelle Methoden zur Verfugung stellen, die bei der Ver- 
wendung einer attributierten Grammatik mit Methoden uberschrieben werden konnen, die ein 
jeweils entsprechendes semantisches Objekt erzeugen. In diesem Falle wird beim Betrieb des 
Dialogsystems die semantische Umsetzung nicht zeitlich getrennt von der syntaktischen 
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Ubeipriifung durch das Applilrationsprogramm durchgefuhrt, sondem die Seniantik wird 
direkt wahiend der Syntaxanalyse ausgefuhrt. 

Bei einem erfindungsgemaBen Verfahren zum Erzeugen eines Dialogsystems mit einer Sprach- 
5 schnittstelle, die gemaB der oben beschriebenen Verf ahren entwickelt wurde, ist es vorteilhaft, 
sowohl die Spracheingabeschnittstelle als audi das Applikationsprogramm in der gjeichen - 
moglicherweise objektorientierten ~ Ubersetzersprache oder in einer auf die gieiche objekt- 
orientierte Plattform abbildbaren Ubersetzersprache zu schreiben. Daraus ergibt sich zwangs- 
laufig, dass sowohl die formale Grammatik als auch die entsprechenden Programmmodule zur 
10 Abbildung der Syntax einer Sprachaufierung auf die passende Semantik in dieser Sprache 
implementiert werden. 

Zur Erstellung einer solchen Spracheingabeschnittstelle gemaB dem genannten Verfahren wird 
einem EntwicMer oder Dienstleister voizugsweise ein System zur Verfiigung gestellt, dass zur 

15 Spezifikation einer formalen Grammatik und edner passenden Semantik Syntaxspezifikations- 
und Semantikdefinitions-Werkzeuge enthalt Mit dem Syntaxspezifikations-Werkzeug kann 
mittels der oben beschriebenen Verfahren eine. formale Grammatik spezifiziert werden, mittels 
der gultige Sprachsignale identifiziert werden konnen. Das Semantikdefinition-Werkzeug 
unterstiitzt einen Bitwickler bei der Beieitstellung bzw. Programmierung der semantischen 

20 Programmmodule und ihrer eindeutigen Zuordnung zu einzelnen Terminal- oder Nichtterminal- 
wortem der Grammatik. Die in Maschinensprache iibersetzten Programmmodule sind dabei 
unmittelbar von dem Applikationsprogramm ausfuhrbar. Im Falle der Erzeugung von unmittet 
bar von der Applikation vervyendbarenPatenstrukturen, werden diese,von den in.Maschinen- 
sprache vorliegenden Teilprogrammen der Spracheingabeschnittstelle erzeugt 

25 

In einer besonders vorteilhaflen Ausfuhrungsform steht dem Grainmatikentwickler dabei eine 
graphische Entwicklungsoberflache als Front- Bid des Syntaxspezifikations- und/der des 
Semantikdefinitions- Weikzeugs zu Verfiigung, die einen Grammatik- Editor und gegebenenfells 
einen Semantik- Editor besitzL Sofern die Spracherkennung d^ Spracheingabeschnittstelle in 
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einer objektorientierten Ubersetzersprache geschrieben ist, stellt der Grarnmatik- Editor einen 
erweiterten Klassen- Browser zur Verfugung, der die einfache Selektion von BasisMassen und 
Vererbung ihrer Funktionalitaten mit graphischen Mitteln (zJB. dutch "drag-and-drop") ermog- 
licht Die Instanziierung der Standard-Ersetzungsregeln durch Terminal- und Mchtteiminal- 
5 worter und/oder Parsing-Methoden sowie gegebenenfalls dutch Methoden zur Definition von 
semantischen Objekten kann dann iiber eine spezielle graphische Schnittstelle vorgenommen 
werden, die eine direkte Assoziation derartiger Daten mit der entsprechenden Gramrnatik- 
Klasse vornimmt und sie automatasch programmtechnisch umsetzt, also den entsprechenden 
Quellcode erzeugt Zu besseren Unterscheidbarkedt von Basis-Klassen, abgeleiteten Klassen, 
10 deren Methoden und semantischen Umsetzungen werden adaquate graphische Symbole 
eingesetzL 

Zur Programmierung der mitunter komplexen semantischen Programmmodule wild vorzugs- 
weise eine Entwicklungsumgebung bereitgestellt, die beispielsweise aus Klassen- Browser, 
15 Editor, Compiler, Debugger und einer Testumgebung besteht, die eine integrierte Entwicklung 
armoglicht und die entsprechende Programmfragmente unter Umstanden in die Grammatik- 
Klassen einkompiliert oder selbstandige dynamische oder statische Bibliotheken erzeugt 

Die Erfindung wird im Folgenden unter Hfinweis auf die beigefugten Zeichnungen anhand von 
20 Ausfuhrungsbeispielen naher erlautert Es zeigen: 
Rgur 1 ednen Dialog eines Dialogsystems, 
Rgur 2 eine Spezifikation einer formalen Grarnmatik, 

Rgur 3 eine schematische Darstellung des Aufbaus eines Ausfuhrungsbeispiels eines 
rfndungsgemaBen Dialogsystems mit einer Spracheingabeschnittstelle, 
25 Rgur 4a eine DefinitLonen von Grarnmatik- Klassen, 

Rgur 4b eine Definition von Grarnmatik- Objekten als Instanzen von Grarnmatik- Klassen, 
Rgur 5 eine semantische Umsetzung eines Grarnmatik- Objektes, 
Figur 6 einen graphischen Entwurf einer Grarnmatik. 
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Formal kann ein Dialogsystem als endlicher Automat beschrieben werden. Sein determi- 
nistisches Verhalten lasst sich mittels eines Zustands/Transitions-Diagramms beschreiben, das 
alle Zustande des Systems und die Ereignisse, die zu einem Zustandswechsel fuhren, die 
5 Transitionen, vollstandig beschreibt Figur 1 zeigt beispielhaft das Zustands/Transitions - Dia- 
gramm eines einfachen Dialogsystems L Dieses System kann zwei verschiedene Zustande SI 
und S2 annehmen und besitzt vier Transitionen Tl, T2, T3 und T4, die jeweils durch einen 
Dialogschritt Dl, D2, D3 und D4 initiiert werden, wobei die Transition Tl den Zustand SI auf 
sich selbst abbildet, wahrend T2, T3 und T4 Zustandswechsel vornehmen. Der Zustand SI ist 

10 der initiale bzw. Startzustand des Dialogsystems, den es am Ende eines jeden Dialogs mit dem 
Benutzer wieder einnimmt In diesem Zustand generiert das System eine StartauBerung, die 
den Benutzer beispielsweise zu einer AuBerung auffordert „Was kann ich fur Sie tun?". Dem 
Benutzer stehen nun die beiden SprachauBerungen „Wie spat ist es?" (Dialogschritt Dl) und 
„Wie lautet die Wettervorhersage?" (Dialogschritt D2) offen. Im Dialogschritt Dl antwortet 

15 das System mit der konekten Uhrzeit und vollzieht anschlieBend die entsprechen Transition 
Tl, indem es wieder in den Startzustand SI zuriickkehrt und erneut die StartauBerung ausgibt 
Im Dialogschritt D2 antwortet das System zur genaueren SpeziSkation des Benutzerwunsches 
mit der Gegenfiage „Fur morgen oder fur nachste Woche?" und wechselt iiber die Transition 
T2 in den neuen Zustand S2. In Zustand S2 kann der Benutzer nur die Gegenfiage des 

20 Systems mit D3 , JFur morgen!" oder D4 ?r Fur nachste Woche!" beantworten, er hat hier nicht 
die Moglichkeit nach der Uhrzeit zu ftagen Auf die Klarstellung des Benutzers in den 
Dialogschritten D3 und D4 antwortet das System mit der jeweiligen Wettervorhersage und 
.. . ,wechselt iiber die.entspredienden Transitionen T3. und T4 wieder in den Startzustand SI. 

25 Um die einzelnen DMogschritte durchfiihien zu konnen und adaquat auf die AuBerung des 
Benutzers reagieren zu konnen, ist es notwendig, die SprachauBeanng des Benutzers einerseits 
konekt zu detektieren und anschlieBend in die von Benutzer gewunschte Reaktion umzu- 
setzen, die AuBerung also zu verstehen. Natiirlich ist es aus Grunden der Benutzerfreund- 
lichkeit und Akzeptanz wunschenswert, dass das Dialogsystem in einem bestimmten Zustand 
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mehrere aqtdvalente AuBerungen tines Benutzers verarbeiten kann. Beispielsweise sollte das 
in Figur 1 beschriebene Dialogsystem bei der Transition Tl nicht nur den einen ^ezifischen 
Dialogschritte Dl verstehen, sondern audi auf synonyme Anfiragen wie z.B. „Wie viel Uhr ist 
es?" Oder „Welche Uhrzeit haben wir?' richtig reagieren. Dariiber hinaus stellen realistische 
5 Systeme in einem Zustand oft eine groBe Anzahl von moglichen Dialogschritten zur Verfiigung, 
die eine Vielzahl von unterschiedlichen Transitionen initiieren. Abgesehen von der trivialen und 
meist impraktikablen Losung, im System alle moglichen Dialogschritte zum Veigjeich nait der 
jeweiligen Benutzeranfirage zusammen mit den entsprechenden Systemreaktionen zu hinterle- 
gen, ist es in derartigen Fallen sinnvoll, die moglichen AuBerungen tines Benutzers durch eine 
10 formale Grammatik GR zu spezifiziereiL 

Figur 2 zeigt ein Beispiel einer formalen Grammatik GR zur sprachlichen Steuerung tines 
Gerates. Die Grammatik GR besteht aus den Nichtterminalwortem <command>, <play>, 
<stop>, <goto> und <dineno>, den TerminalwQrtem „play" „go", „start" „stop", , ,halt", 

15 ,#uit", „go to line", „1", ,,2" und ,3" und Ersetzungsiegeln AR und KR, die fur jedes 

Mchttermiualwort eine Ersetzung durch Mchttenninal- und/oder Terminalwortem vorschreibt 
Entsprechend ihrer Funktionsweise werden die Ersetzungsiegeln in Alternativrcgeln AR und 
Ketteniegeln KR unterschieden, wobei das Startsymbol <command> von eine Alternativregel 
abgeleitet wiixL Eine Alternativregel AR ersetzt ein Mchtterminalwort durch eine der genann- 

20 ten Alternatives und eine Kettenregel KR ersetzt ein Nichtterminalwort durch tine Reihung 
von weiteren Terminal- oder Nichttemiinalwortem. Beginnend mit der initialen Ersetzung des 
Startwortes <command> konnen alle giiltigen Satze - also giiltige Reihungen von Teaminal- 
wortern - der durch die fonnale Gr ammatik GR spezLBzierten Sprache in Form eines Ablet 
tungs- bzw. Ersetzungsbaums generiert werden. So wird durch die sequentielle Ersetzung der 

25 Nichtierminalsymbole <command>, <goto>, und <lineno> beispielsweise der Satz „go to line 
2" erzeugt und als giiltige SprachauBerung definiert, nicht aber den Satz ^proceed to line 4" 
Diese Ableitung eines konkreten Satzes aus dem Startwort ieprasentiert den Schritt der Syn- 
taxanalyse. 
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Da die in Figur 2 genannte Grammatik GR eine attributierte Grammatik ist, erlaubt sie die 
direkte Abbildung der Syntax auf die Semantik, dk auf von der Applikation 3 ausfuhr- 
baren/interpietierbaien Kommandos. Diese sind beieits in der Grammatik GR fur jedes 
einzelne Terminalwort - angegeben in den geschweiften Klammem - spezifiziert Die in der 
5 Syntaxanalyse SA als giiltig erkannte AuBerung „go to line 2" wild in die Kommandos 
„GOTO TWO" semantisch umgesetzt Dutch die Abbildung mehrerer syntaktische Kon- 
strukbe auf die gjeiche Semantik werden auch synonyme AuBerungen berucksichtigt So 
werden beispielsweise die AuBerungen „play" „go" und „start" auf das gjeiche Kommando 
,JPLAY" semantisch abgebildet und fuhten zur gleichen Reaktion des Dialogsystems L 

10 

Ein Ausfuhrungsbeispiel eines Dialogsystems 1 mit einer erfindungsgemaBen Spracheingabe- 
schnittstelle 2 und einer mit der Spracheingabeschnittstelle zusammenwirkenden Applikation 3 
ist in Figur 3 dargestellt Die Applikation 3 umfasst eine Dialogsteuerung 8, die das Dialog- 
system 1 gemaB der in einem Zustands/Transitions - Diagramm festgelegten Zustande, Tiansi- 
15 tionen und Dialoge steuert 

Eine.eingehende SprachauBerung. wird nun zunachst wie iiblich von einer Signalaufiiahme- 
Einheit 4 der Spracheingabeschnittstelle 2 in ein digitales Audiosprachsignal AS umgesetzt 
Der eigentliche Prozess der Spracherkennung wird dabei von der Dialogsteuerung 8 durch ein 
20 StartsignalSTinitiierL 

Der in dor Spracheingabeschnittstelle 2 integrierte Spracheikenner 5 umfasst eine Syntaxana- 
lyse-Einheit zur Duichfuhrung der Syntaxanalyse SA und eine Semantiksynthese-Euihdt zur 
Durchfuhrung der anschlieBenden Semantiksynthese SS. Die im Syntaxanalyse- Schritt zu 
25 uberpriifende formale Grammatik GR (oder eine von ihr abgeldtete Datenstruktur, die von der 
Syntaxanalyse diiekt verwendet wird) wird gemaB dem aktuellen Zustand des Dialogsystems 
1 und der zu erwartenden Dialoge von der Dialogsteuerung 8 jeweils an die Syntaxanalyse- 
Einheit 6 iibergeben. GemaB dieser Grammatik GR wird das Audiosprachsignal AS verifiziert 
und im Falle dex Giiltigkeit von der Semantiksynthese- Einheit 7 auf seine Semantik abgebildet 
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Es existieren zwei Varianten zur Definition von Semantik. Soweit nicht anders abweichend 
erwahnt, wird im folgenden davon ausgegangen, dass es sich ohne Beschrankung der Er- 
findung bei dem Erkennungsergebnis ER urn ein oder mehrere Programmmodule handelt 
5 Hierbei ergibt sich die Semantik direkt aus der direkten Zuordnung von Terminal- und 
Nichtterminal^^ zu maschinensprachlichen Programrnmodulen PM, die von einer 
Prograrnmausfuhrungseinheit 9 der Applikation 3 ausgefuhrt werden konneDL Die maschinert- 
sprachlichen Programmmodule PM aller Terminal- und Mchtteiminalworter einer vollstandig 
abgeleiteten SprachauBerung werden dabei von der Semantiksynthese-Rinheit 7 zu ednem 
10 maschinensprachlichen Erkennungsergebnis ER zusammengefuhrt und der Programmaus- 
flihrungseinheit 9 der Applikation 3 zur Ausfuhrung bereitgestellt bzw. ihr als unmittelbar 
ausfiihrbares Maschinenprogramm ubergeberu 

Zur vollstandigen Beschrcibung der Erfindung sei zusatzlich erlautert, dass in einer zweiten 
15 Variante den Terminal- und Nichttemunalwortem auch Datenstrukturen zugeordnet werden 
konnen, die unmittelbar von maschinensprachlichen Programmteilen der Spiacheingabe- 
schnittstelle 2 generiert werden und die ein Erkennungsergebnis ER reprasentierea Diese 
Datenstrukturen konnen dann ohne weitere interne Umsetzung, Transformation oder Inter- 
pretation von der Applikation 3 verwendet werden. Es ist dariiber hinaus auch moglich, die 
20 bedden genannten Varianten zu kombinieren, so dass die Semantik zum Teil durch maschinen- 
sprachliche Programmmodule und zum Teil durch unmittelbar von der Applikation verwend- 
bare Datenstrukturen defiuoiert wird 

Sowohl die Spracherkennung 5 der Spracheingabeschnittstelle 2 als auch das Applikations- 
25 programm 3 sind hier in der gleichen objektorientierten Ubersetzersprache geschrieben, oder 
ein Sprachen, die auf der gleichen objektorientierten Plattform ablaufiahig sind Die Ubergabe 
des Erkennungsergebnisses ER ist somit sehr einfech durch Ubermittlung von Referenzen bzw. 
Zeigem mogtich. Die Verwendung einer objektorientierten Ubersetzersprache ist - insbeson- 
dere auch bei der oben genannten Kombination von semantischen Programrnmodulen und 
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Datenstrukturen - besonders vortedlhaft. Duich den objektorientierten Progranimentwuif 
werden zudem sowohl die Grammatiken GR als auch das Erkennungsergebnis ER in Form 
von progj^orimiersprachlichen Objekten als Instanzen von Grammatik- Klassen GK bzw. als 
Methoden dieser Klassen realisiert Die Figuren 4a, 4b und 5 zeigen diesen Prozess im Detail. 

5 

Ausgehend von der Definition der formalen Grammatik GR in Figur 2 zeigt Figur 4a die 
Implementierung geeigneter Grammatik- Klassen GK zur Umsetzung dear formalen Definition in 
eine objektorientierte Programmiersprache. Samtliche Grammatik-IQassen GK werden hier 
von einer abstrakten grammatikaHschen Basisklasse BK abgeleitet, die ihre Mefhode an die 
10 von ihr abgeleiteten Grammatik- Klassen GK vererbt In dem in Figur 4a dargestellten Aus- 
fiihrungsbeispiel handelt es sich urn diei verschiedene abgeleitete Grammatik- Klassen GK, die 
als mogliche prototypische Ersetzamgstegeln in Form einer Terminalregel TR, eine Alternativ- 
regel AR und eine Kettenregel KR implementiert werden. 

15 Die abstrakte Basisklasse BK verlangt die Methoden GetPhaseGridO, ValueO und 

PartialParseO, wobei die Methode GetPhaseGridO zur Initialisierung des signaltechnischen 
Spracherkennungsprozesses verwendet wird undzum Verstandnis des syntaktischen Erken- 
nungsprozesses nicht betrachtet werden muss. Abgesehen von GetPhaseGridO ist die einzige 
von auBen anzusprechende Funktionalitat die Methode ValueO, die den ihr mit dem Argument 

20 , , phrase" ubergebenen Satz evaluiert und somit den Zugriff auf die zentrale Parsing-Funklio- 
nalitat realisiert ValueO gibt als Ergebnis die Semantik zuriick. In einem einfachen Fall kann 
dies eine liste sein, die die eikannten syntaktischen Binheiten des Satzes sqparat auffiihrt 
.GemaB.der. formalen Grammatik GR aus Rgur. 2 wiirde beispielsweise fur die Phrase „go to 
line 2" die liste G*go to line", ,^") eizeugt werden. hi anderen Fallen konnen die Daten weiter 

25 veraibeitet weiden, wie in dem oben aufgefuhrten Beispiel der Zeit- Grammatik Der Mecha- 
nismus dazu wird weiter unten beschriebeaa. Dieses Ergebnis der Syntaxanalyse SA wird 
anschliefiend semantisch in ein Maschinensprachqprogramm bzw. in eine Datenstruktur 
umgesetzt und der Applikation 3 zur unmittelbaren AusfuhrungA^ erwendung bereitgestellt Da 
die Arbeitsweise der ubergeordneten Parsing- Methode ValueOvon den jeweils anwendbaren 
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Ersetzungsregeln abhangt, gredft ValueO intern auf die abstrakte Methode PartialParseO 
zuriick. Diese kann jedoch nicht bereits in der Basisklasse BK realisiert werden, sondern wird 
erst durch die jeweiMge abgeleitete Grammatik-Klasse GK implementiert 

5 Die in der Basisklasse BK verlangte Parsing-Funktionalitat der PartialParseO-Mefhode wird 
also erst in den Grammafikkl assen GK implementiert Neben dieser regelabhangigen Parsing- 
Methode besitzen die abgeleiteten Grammatiklassen GK spezLfische sogenannte Konstruk- 
toren (PhraseGrammarO, ChoiceGrammarO, ConcatenatedGrammarO), mit denen zur 
Laufeeit der Syntaxanalyse SA Instanzen dieser Klassen, also Graromatik- Objekte GO 

10 erzeugt werden konnea Die abgeleiteten Graromatik- Klassen TR, AR, und KR stellen also 
das programmiersprachliche „Geriist" fur die Realisierung einer konkreten Ersetzungsregel 
einer bestimmten formalen Grammatik GR dar. Der Konstruktor der Terminalregel TR 
PhraseGrammar benotigt lediglich das Terminalwort, durch das ein bestimmtes Nichtterminal- 
wort zu ersetzen ist Der Konstruktor der Alternativregel AR OioiceGrammar benotigt eine 

15 Liste mit den moglichen altemativen Ersetzungen, wahrend der Konstruktor der Kettenregel 
KR ConcatenatedGrammar eine Liste von aneinanderzureihenden Terminal- und/oder 
Nichtterminalwortem ben5tigt Jede dieser drei Grammatik-Klassen GK realisiert auf 
individuelle Art und Weise die abstrakte PartialParseO-Methode der Basisklasse BK. 

20 Ausgdiend von den in Figur 4a dejSnierten Grammatik-Klassen GK zeigt Figur 4b als Beispiel 
die Verwendung dieser Klassen zur Realisierung der in Figur 2 angegebenen Grammatik GR 
dutch dieEizeugung (Tnstanziierung) von Grammatik- Objekten GO. Das Command- Objekt 
wird durch Tnstanziierung derjenigen Grammatik-Klasse GK zur Laufeeit erzeugt, die die 
Alternativregel AR realisiert. Seine Funktion ist, das nichtterminale Startwort <command> 

25 durch eines der Mchttenninalworter <play>, <stop> oder <goto> zu a*setzen r die dem 
Konstruktor der jewedligen Alternativregel AR als Argumente mitgegeben werden. 

Das Play- Objekt wird ebenfalls durch das Aufrufen des Konstruktors der Alternativregel AR 
erzeugt Anders als beim Konstruktoraufiruf des Command- Objekts enthalt das Argument der 
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Konstri^oraufrufs des Play-Objekts keine Nichtterminalworter, sondern ausschlieBlich 
Terminalworter. Die Terminalworter werden durch einen geschachtelten Aufiruf des Kon- 
struktors der Terminalregel TR angegeben und realisieren die Worter „play", „go", und „start" 
Ebenso werden die Ersetzungsregeln der Nichtterminalworter <stop> und <Iineno> durch 
5 entsprechende Aufrufe des Konstruktors der Altemativregel AR erzeugt Das Goto- Objekt 
wird schlieBlich als Listanz derjenigen Grammatik- Klasse GK erzeugt, die die Kettenregel KR 
implementiert Der Konstruktor enthalt das Teniiinalwort „go to line" und das Nichtterminal- 
wort <lineno> als Argument 

10 Zur semantischen Umsetzung einer durch die Grammatik- Objekte GO evaluierten AuBerung 
werden bei der fonnalen Grammatik GR aus Figur 2 lediglich die Terminalworter in Pro- 
grammmodule PM umgesetzt, der Applikation 3 als Referenzen ubergeben und unmittelbar 
von ihr ausgefuhrt Die Programmmodule PM oder entsprechende Referenzierungen sind mit 
den Terminalwortern diiekt iiber die Definition der Grammatik GR assoziiert (siehe Fig. 2). In 

15 der konkreten Ausfuhrungssituation sieht dies beispielsweise wie folgt aus: jede der 

<command>-Regeln erzeugt ein Command- Objekt, dessen ExecuteO-Methode von der 
Applikation 3 direkt ausgefuhrt werden kann. Die goto-Regel wurde dabei ein spezielles 
Command- Objekt erzeugen, dass auch die entsprechende Zeilennummer enthalt 

20 Im Gegensatz zu dieser strikten Trennung zwischen Syntaxanalyse SA, Semantiksynthese SS 
und Ausfiihren des semantischen Maschinenspracheprograinms zeigt Figur 5 eine diiekte 
Synthese der semantischen Anweisungen und ihre Ausfiihrung dutch die Spracheingabe- 
. schnittstelle 2 am Beispiel eines Grammatik- Objektes GO, das eine Multiplication durch eine 
Kettenregel KR realisiert Das Multiplikation- Objekt wird instanziiert als Aneinandemeihung 

25 von drei Hementen: einer natiMichen Zahl zwischen 1 und 9 (die Klasse NumberGrammar 
kann beispielsweise durch Vererbung aus der Klasse ChoiceGrammar entstehen), dem Ter- 
minalwort „times" und einer emeuten natiiriichen Zahl aus dem Intervall 1 bis 9. Anstatt als 
Ergebnis des Parsens die Liste 03", „times", 9 J5 6C ) zur semantischen Umsetzung zu ubergeben, 
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kann die Anweisung ,3 times 5" direkt im Objekt ausgefiihrt und das Ergebnis 15 zuriickge- 
geben werden. Die Berechnung wird dabei im vorliegenden Beispiel dutch einen speziellen 
Synthese-Eventhandler SE vorgenommen, der die Daten des Multiplikatiori-Objektes - im 
vorliegenden Beispiel also die beiden Faktoren der Multiplikation - entnimmt und vedmiipft. 

5 

Eine derartige effiziente und mit der Syntaxanalyse SA verzahnte Semantik-Synthese SS wird 
allein durch die ecfindungsgemaBe Implementierung der Semantdk eines syntaktischen Kon- 
strukts in einer Ubersetzersprache und Ubersetzung in unmittelbar ausfuhrbare maschinen- 
sprachliche Programmmodule PM ermoglicht, da nur so die Semantiksynthese SS direkt in die 
10 Syntaxanalyse SA integriert werden kann. Dutch die Verwendung einer objektorientierten 
anstelle einer prozeduralen/imperativen Programmiersprache konnen die verwendeten 
Datenstruktuien zusatzlich fur Dienstleister und Endanwender geeignet strukturiert und k 
gekapselt werden, wahrend der Datentransfer zwischen Syntaxanalyse und Semantiksynthese 
efEzient kontrollierbar ist 

15 

Eine spezielle Funktionalitat von Designwerkzeugen zum Grammatikentwurf wird anhand von 
Figur 6 am Beispiel einer Zeitgrammatik erlauterL Zum Entwurf einer speziellen Grammatik 
werden die von den Grammatik- Klassen GK vorgegebenen Ersetzungsregeln KR, AR und 
TR graphisch kombiniert und durch Einsetzen entsprechender Terminal- und Nichtterrninal- 
20 worter instanziiert, also entspiech^ide Grammatik- Objekte GO erzeugt 

Die verschiedenen Ersetzungsregeln werden daher in Figur 6 dutch unterschiedliche Formen 
der Boxen des Flussdiagramms unterschieden. Nach der graphischen Selektion einer be- 
stimmten R^etzungsregel wird zur SpeziBkation (also zur Instanzdierung der Regel) bei- 
25 spielsweise durch Doppelklick oder eine beliebige andere Benutzeraktion ein Grammatik- 

editor geofEaet, in welchem zur Spezifikation der Sub-Gramrnatik, je nach ausgewahlter Regel, 
die Altemativen, die Reihungen oder die Tenninalworter angegeben waxlen konnen. Nach 
der Spezifikation der entsprechenden Sub -Grammatik wird der Unterbaum wieder ge- 
schlossen und die spezifizierte Teil- Grammatik erscheint in formaler Schieibweise in der 
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iibergeordneten Box. Urn komplexe Qrammatiken zu ermoglichen, konnen zur Spezifizierung 
einer Sub -Grammatik weitere Regeln in sie eingesetzt werden. 

Im Beispiel der Uhrzeit- Grammatik beginnt der Entwurf mit dear Auswahl einer Alternativregel 
5 AR, die mit vier Sub- Grammatiken in Form von alternativen Kettenregeln KR - angezeigt 
durch die ovalen Boxen - belegt wird. 

Fur die erste und vierte der Alternativen sind die Baume der Sub - Grammatiken gpschlossen, 
durch einen Doppelklick auf die entsprechenden Boxen bzw. durch eine entsprechende 
10 Aktion konnen sie jedoch sichtbar gemacht werden So wiirde bei der vierten Alternative 
((1..20Iquarter)(minutes tol to)1..12) durch einen Doppelkhck o.A auf die Kettenregel-Box 
KR eine Reihung aus zwei Altemativregeln AR und einer Tenninalregel TR sichtbar. 

Fiir die zweite und dritte der Alternativen sind die Baume der Sub - Grammatiken teilweise 
15 sichtbar. Die zweite Alternative ((1..12(1..59I))(AMIPMI)) besteht aus einer Reihung aus der 
Kettenregel (1..12(1..59l)) und der Alternativregel (AMIPMI). Die Kettenregel KR besteht 
. .wiederum aus einer Reihung aus einer Terminalregel TR und einer Alternativregel AR, die zwei 
alternative Terminalregeln TR beinhaltet Die Alternativregel AR bietet drei verschiedene 
Terminalregeln TR als Alternativen an, die die Terminalworter , ,AM'\ , ^M" und ein noch nicht 
20 spezifiziertes drittes Teiminalwort einsetzten. Durch DoppeUdick oA auf eine Terminalregel 
TR konnen die abschliefiend einzusetzenden Terminalworter, also das Vokabular der foimalen 
Sprache, angegeben werden. Auf diese Art und Weise kann mit dem Grammatikeditor eine 
beliebige Grammatik GR in der gewiinschten Komplexitat spezifiziert und graphisch dargestellt 
werden. 

25 

Die auf diese Weise graphisch spezifizierte formale Grammatik wird nun vollstandig und 
automatisch in entsprechende progiammiersprachliche Grammatik- Klassen GK einer 
objektorientierten Ubersetzersprache umgesetzt, die nach der Ubersetzung zur Laufzeit des 
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Dialogsystems 1 iostanziiert werden und als Ersetzungsregeln die Gultigkeit einer SprachauBe- 
rung dutch Ableiten/Parsen verifizieren. 

5 Dutch Aktivierung einer entsprechenden FunMon eines Semantikeditors kann automatisch ein 
Eventhandler SE zur Semantik- bzw. Attributsynthese erzeugt werden. Es ofifhet sich dann 
automatisch ein Editorfenster, in dem der entsprechende Programmcode fur den Event in der 
objektorientierten Ubersetzersprache erganzt werden kann. Nach ihrer Ubersetzung kann die 
so spezifizierte Granmatik-Klasse der Applikation in Fonn einer statisch oder dynamisch zu 
10 bindenden Bibliothek zur Ausfuhrung bereitgestellt werden. 

Es wird abschlieBend noch einmal darauf hingewiesen, dass es sich bei der in den Figuren und 
der Beschieibung dargestellten Spracheingabeschnittstelle und dem Dialogsystem lediglich um 
Ausfuhrungsbeispiele handelt, die vom Fachmann in einem weiten Umfang variiert werden 

15 konnen, ohne den Rahmen der Erfindung zu verlassen. Insbesondere konnen die Programm- 
fragmente, die bei den gezeigten Ausfuhrungsbeispielen in der objektorientierten Programmier- 
sprache Ctt verfasst sind, in jeder beliebigen anderen objektorientierten Programmiersprache 
oder sogar in anderen imperativen Programmiersprachen geschrieben werden. Es wird auBer- 
dem der Vollstandigkeit halber darauf hingewiesen, dass die Verwendung der unbestimmten 

20 Artikel „ein" bzw. „eine" nicht ausschliefit, dass die betreflfenden Merkmale auch mehrfach 
vorhanden sein kGnnen, und dass die Verwendung des Begriffs „umfassen" nicht die Existenz 
weiterer Elemente oder Schritte ausschliefit 
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PATENTANSPRUCHE 



1. Verfahren zum Betrieb eines Dialogsystems (1) mit einer Spracheingabeschnittstelle (2) und 
einer mit der Spracheingabeschnittstelle (2) zusammenwirkenden Applikation (3), bei dem die 
Spracheingabeschnittstelle (3) Audiosprachsignale (AS) eines Benutzers erfasst und direkt in 
ein Erkennungsergebnis (ER) in Form von Binardaten umsetzt, die unmittelbar von der 

5 Applikation (3) verwendbar sind 

2. Verfahren nach Anspruch 1, 
dadurch gekennzeichnet 

dass die Binardaten zumindest ein in Maschinensprache vorliegendes, unmittelbar von der 
10 Applikation (3) ausfuhrbares Programmmodul (PM) in Form eines Objekts einer 

objektorientierten Ubersetzersprache und/oder ein Datenobjekt einer objektorientierten 
Ubersetzersprache umfassen. 

3. Verfahren nach Anspruch 1 oder 2, 
15 dadurch gekennzeichnet 

dass beim Umsetzen des Audiosprachsignals (AS) in ein Eikennungsergebnis (ER) zunachst in 
einem Syntaxanaly se- Schritt (SA) die dem Audiosprachsignals (AS) entsprechende Phrase 
aufgrund einer fonnalen Grammatik (GR) detektiert wird, wobei das gultige Vokabular des 
Audiosprachsignals (AS) den Teraainalwoitem der fonnalen Grammatik (GR) entspricht, und 
20 anschlieBend das Erkennungsergebnis (ER) in einem Semantiksynthese- Schritt (SS) aus den 
den Tenninalwortern zugeordneten, in Maschinensprache vorliegenden ausfuhrbaren 
Programmmodulen (PM) genoiert wird 
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4. Verfahren nach Anspruch 3, 
dadurch gekennzeichnet 

dass die Grammatik (GR) vor dem Beginn eines Dialogs vollstandig definiert wird und 
wahrend des Dialogs unveranderbar ist 

5 

5. Verfahren nach Anspruch 3, 
dadurch gekennzeichnet 

dass die Grammatik (GR) wahrend eines Dialogs dynamisch geandert wird. 

10 6. Verfahren nach einem der Anspriiche 3 bis 5, 
dadurch gekennzeichnet 

dass die Grammatik (GR) Ersetzungsregeln (AR, KR) umfasst, die als objektorientierte 
Grammatik-Klassen (GK) realisiert sind, die jeweils eine regelabhangige Parsing-Funktion als ; 
Melhode besitzen. 

15 

7. Verfahren nach einem der Anspriiche 3 bis 6, 
dadurch gekennzeichnet 

dass die Grammatik (GR) in Form von zumindest einem Grammatik- Objekt (GO) als Instanz 
zumindest einer objektorientierten Grainmatik-Klasse (GK) spezifiziert ist und beim 
20 Syntaxanalyse-Schritt (SA) das Audiosprachsignal (AS) gemaB von &setzungsnegeln (AR, 
KR) der Grammatik (GR) uberpriift wird 

8. Verfahren nach einem der Anspriiche 3 bis 7, 
dadurch gekennzeichnet 

25 dass der Syntaxanalyse-Schritt (SA), der Semantiksynthese-Schritt (SS) und/oder eine 
VerwenduQg/Ausfuhrung des Etkennungsergebnisses (ER) zumindest teilweise zeitlich 
iiberlappend erfolgeru 
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9, Verfahren nach einem der Anspriiche 6 bis 8, 
daduich gekennzeichnet 

dass ein das Erkennnngsergebnis eizeugender Programmtp.il der Spracheingabeschnittstelle als 
5 Methode einer objektorientierten Klasse, insbesondere als Methode des Grammatik- 
Objektes (GO) eingebunden wird. 



10. Verfahren nach einem der Anspriiche 6 bis 8, 
dadurch gekennzeichnet 

10 dass das Erkennungsergebnis (ER) von einer Methode einer Grammatik- Klasse (GK) 
definiert und von dieser als Objekt zuriickgegeben wird 

11. Verfahren zur Erstellung einer Spracheingabeschnittstelle (2) fur ein Dialogsystem (1) mit 
einer rnit der Spracheingabeschnittstelle (2) zusarnmenwirkenden Applikation (3), umfassend 

15 die Schritte: 

- Spezifizieren giiltiger Spracheingabesignale (AS) durch eine formale Grammatik (GR), 
wobei das gultige Vokabular der Spracheingabesignale in Form von Terminalwortern der 
Grammatik (GR) definiert wird, 

- Bereitstellen von Binardaten, die die Semantik giiltiger Audiosprachsignale (AS) 
20 reprasentieren und die aus zur Systemlaufceit von der Applikation (3) unmittelbar 

verwendbaren und von einem Programmteil der Spracheingabeschnittstelle (2) erzeugten 
Datenstrukturen und/oder unmittelbar von der Applikation (3) ausfuhrbaren 
Pragrammmodiilen (PM) bestehen, und/oder Bereitstellen von Programmteilen, welche die 
Binardaten erzeugen, 

25 - Zuordnen der Binardaten und/oder Programmteilen zu einzdnen oder Kombinationen von 
Terminalwortern oder Nichtteiminalwortem zur Abbildung eines gultigen 
Audiosprachsignals (AS) auf eine passende Semantik, 
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- Ubersetzen der Programmteile und/oder Programmmodule (PM) in Maschinensprache so, 
dass die iibersetzten Programmteile beim Betrieb des Dialogsystems (1) unmittelbar von 
der Applikation (3) nutzbare Datenstruktuien eizeugen bzw. die ubersetzten 
Programmmodule (PM) beim Betrieb des Dialogsystems (1) unmittelbar von der 
5 Application (3) ausfuhrbar sind. 

12. Verfahren nach Anspruch 11, 
daduich gekennzeichnet 

dass die formale Grammatik (GR) durch zumindest ein Grammatik- Objekt (GO) als Instanz 
10 zumindest einer objektorientierten Grammatik-Klasse (GK) spezifiziert wircL 

13. Verfahien nach Anspruch 12, 
daduich gekennzeichnet 

dass zumindest eine Grammatik- Klasse (GK) durch Vererbung axis einer oder mehreren 
15 vorgegebenen Klassen einer Grammatik- Klassenhierarchie und/oder einer Grammatik- 
IQassenbibliothek abgeleitet wircL 

14. Verfahien nach einem der Anspniche 11 bis 13, 
dadurch gekennzeichnet 

20 dass die Programmmodule (PM) in einer objektorientierten Ubersetzersprache program mi ert 
werden. 

15. Veifahren nach einem der Anspriiche 12 bis 14, 
daduich gekennzeichnet 

25 dass zumindest eine Grammatik-Klasse (GK) und/oder die Programmmodule (PM) in 
Maschinensprache ubersetzt werden und als statisch und/oder dynamisch zu bindende 
Bibliothek bCTeitgestellt werden. 
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16. Verfahren nach einem der Anspriiche 11 bis 15, 
dadurch gekennzeichnet 

dass die Spezifikation der formalen Grammatik (GR) mit Hilfe eines graphischen Grammatik- 
5 Editors erfolgt und/oder die Definition der Semantik mit Hilfe eines graphischen Semantik- 
Editors erfolgt 

17. Verfahren nach Anspruch 16, 
dadurch gekennzeichnet 

10 dass die Spezifikation der foimalen Grammatik (GR) mit Hilfe des graphischen Grarnmatik- 
Editors durch Seleklieren und/oder Ableiten von vorgegebenen Grammatik-Klassen (GK) 
und Belegen der Grammatik-Klassen mit Brsetzungsregeln (AR, KR) und/oder 
Terminalwortern und/oder Nichttemiinalwortem erfolgt, wobei jeder Grammatik- Klasse (GK) 
und/oder jeder Ersetzungsregel (AR, KR) ein graphisches Symbol zugeordnet ist 

15 

18. Verfahren nach Anspruch 16 oder 17, 
dadurch gekennzeichnet 

dass der graphische Semantik-Editor zur Definition der Semantik der formalen Grammatik 
(GR) fur jedes Programmmodul (PM) ein Editor-Fenster zum Erstellen des Programmmoduls 
20 (PM) bereitstellt und das Programmmodul mit einem Terminal- oder Nichtterminalwort 
assoziiert 

19. Verfahren zum Erzeugen eines Dialogsystems (1) mit einer Spracheingabeschnittstelle (2) 
und einer Applikation (3), wobei die Spracheingabeschnittstelle (2) mit einem Verfahren nach 

25 einem der Anspriiche 10 bis 17 erzeugt wurde. 
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20. Verfahren nach Anspruch 19, 
dadurch gekennzeichne t, 

dass die Spracheingabeschnittstelle (2), die Applikation (3) und gegebenenfalls die zum 
5 Erkennungsergebnis (ER) gehorenden ProgrammmoduleQPM) jeweils zumindest teilweise in 
der gleichen objektorientierten Ubersetzersprache geschrieben werden oder auf dergleichen 
objektorientierten Plattf omi ablaufiahig sind 

21, Spracheingabeschnittstelle (2) fur ein Dialogsystem (1) zur sprachlichen Steuerung eines 
10 Gerates oder Prozesses durch einen Benutzer, die mit einer Applikation (3) des Dialogsystems 

(1) zusarnmenwidct und Audiosprachsignale (AS) erfasst und diese diiekt in ein 
Erkennungsergebnis (ER) in Form von unmittelbar von der Applikation (3) verwendbaren 
Binardaten umsetzL 

15 22. Dialogsystem (1), umfassend eine Spracheingabeschnittstelle (2) nach Anspruch 20. 

23. System zur Erstellung einer Spracheingabeschnittstelle (2) eines Dialogsystems (1), 
umfassend 

ein SyntaxspeziBkations-Weikzeug, mit dem gultige Audiosprachsignale (AS) des 
20 Dialogsystems (1) durch eine formale Grammatik (GR) spezifiziert werden, wobei das gultige 
Vokabular dear Audiosprachsignale (AS) in Foim von Terminalwortem der Gramm atik (GR) 
definiert wird, und 

ein Semantikdefinitions-Waizeug zum Bereitstellen von Programmmodulen (PM) und 
Zuordnen der Programmmodule (PM) zu einzelnen oder Kombinationen von 
25 Tenninalwortem, derart dass nach einer Ubersetzung in Maschinensprache die iibersetzten 
Programmmodule (PM) beim Betrieb des Dialogsystems (1) von der Applikation (3) 
unmittelbar ausgefuhrt werden konnen. 
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24. System nach Anspruch 23, 
gekennzeichnet durch 

eine objektorientierte Grammatik-KkssenbibHothek und/oder eine objektorieatierte 
5 Grammatik- Klassenhiea*archie 7 so dass die foraiale Grammatik (GR) als Instanz einer der 
Grammatik-Klassenbibliothek entnommenen oder von den Klassen der Grammatik- 
Klassenbibliofhek abgeleiteten Grammatik- Klasse (GK) und/oder als Instanz einer der 
Gimnmatik-Klassenhierarchie entnommenen oder von den Klassen der Grammatik- 
Klassenhierarchie abgeleiteten Grammatik- Klasse (GK) spezifiziert ist 

0 

25, System nach Anspruch 23 oder 24, 
gekennzeichnet durch 

einen graphischen Giammatik-Editor zur Spezifikation der formalen Grammatik (GR) 
und/oder einen graphischen Semantik-Editor zur Definition der Semantik. 
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ZUSAMMENFASSUNG 
Spracheingabeschnittstelle fur Dialogsysteme 

Es wird ein Verfahren zum Betrieb eines Dialogsystems (1) mit einer 
5 Spracheingabeschnittstelle (2) und einer mit der Spracheingabeschnittstelle (2) 

zusammenwiikenden Application (3) beschrieben. Dabei erfasst die Spracheingabe- 
schnittstelle (2) Audiosprachsignale (AS) eines Benutzers und setzt diese in ein 
Ertennungsergebnis (ER) in Form von unmittelbar von der Applikation verwendbaren 
Binardaten. Dieses Erkennungsergebnis (ER) wird der Applikation (3) beteitgestellt 
10 AuBerdem werden ein Verfahren und ein System zur Erstellung einer entsprechenden 

Spracheingabeschnittstelle (2) sowie eine Spracheingabeschnittstelle (2) und ein Dialogsystem 
(1) mit einer derartigen Spracheingabeschnittstelle (2) beschrieben. 

Fig. 3 

15 
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FIG. 1 

(Stand der Technik) 



AR <command> = <play> | <stop> | <goto>; 

AR <play> = (play|go|start){PLAY}; 

AR <stop> = (stop|halt|quit) {STOP}; 

KR <goto> = go to line <lineno> {GOTO}; 

AR — <lineno>= 1 {ONE} 1 2{TWO} | 3 {THREE}; 



FIG. 2 

(Stand der Technik) 
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FIG. 3 
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BK [ abstract class Grammar { 

PhraseGrid GetPhraseGridO 
object Value(Phrase phrase) 

abstract ParseNodeQ PartialParse(Phrase phrase, int start) 
} 



SR C class PhraseGrammar : Grammar { 
^\ J PhraseGrammar(Phrase grammarphrase) 

1 ParseNodeQ PartialParse(Phrase phrase, int start) 

} 



AR fclass ChoiceGrammar : Grammar { 
~\ ^ ChoiceGrammar(param Grannnar[] alternatives) 

ParseNodeQ PartialParse{Phrase phrase, int start) 

} 



i 



KR I class ConcatenatedGrammar : Grammar { 

ConcatenatedGrammar(param GrammarQ constituents) 
ParseNodeH PartialParse(Phrase phrase, int start) 

> 



FIG. 4a 
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AR-H^ Grammar command = new ChoiceGrammar(play, stop, goto) 

AR— ► Grammar play = new ChoiceGrammar( 

new PhraseGrammar("play"), 
new PhraseGrammar("go") 3 
new PhraseGrammar("start") 
) 

ARr+* Grammar stop = new ChoiceGrammar( 

new PhraseGrammar("stop") 5 
new PhmseGrammar( ,f halt"), 
new PhraseGrammar("quit running") v. 

) ' 

ARt* Grammar lineno = new ChoiceGrammar( 

new PhraseGrammar(" 1 % 
new PhraseGrammar("2"), 
new PhraseGrammar( ,f 3 ff ) 
) 

KR— Grammar goto = new ConcatenatedGrammar( 

new PhraseGrammar("go to line"), 
lineno 

) 
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KR Grammar multiplication = new ConcatenatedGrarnmar( "\ GO 

new NimberGrammar(l ? 9) 5 ( 
new PhraseGrammar("times lf ), ^ 
new NumberGratnrn ar( 1 ,9) 

) 

SE void OnSynthesize(SynthesizeEventArgs e) { 
e.Value = e.Values[0] * e.Values[2] 

} 
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